专利摘要:
此處實施例係有關於包括監督員系統及作業系統之計算裝置。於一實施例中,該監督員系統係用來啟動與監視該作業系統。監督員系統係用來當計算裝置的作業系統發生崩潰時回復該計算裝置之控制。
公开号:TW201303580A
申请号:TW101111700
申请日:2012-04-02
公开日:2013-01-16
发明作者:Fletcher Liverance;Timothy J Freese
申请人:Hewlett Packard Development Co;
IPC主号:G06F11-00
专利说明:
監督員系統回復控制技術
本發明係有關於監督員系統回復控制技術。 發明背景
於遠端行政管理環境中,管理員可能並不實體接取由該管理員所管理的計算裝置。但雖言如此,該等計算裝置通常安裝有軟體許可該管理員遠端接取該等計算裝置。
依據本發明之一實施例,係特地提出一種計算裝置包含儲存一監督員系統來啟動與監視一作業系統的一第一記憶體位置;儲存用來控制該計算裝置之該作業系統的一第二記憶體位置;及基於該作業系統來開機該計算裝置的一處理器,其中該監督員系統係將該計算裝置之控制移轉給該作業系統,及當該作業系統內發生崩潰時該監督員系統係將回復該計算裝置之控制。 圖式簡單說明
後文詳細說明部分係參考附圖,附圖中:第1圖為計算裝置之一實例之方塊圖;第2圖為包括第1圖計算裝置之網路系統一實例之方塊圖;及第3圖為該計算裝置之遠端崩潰復原方法之一實例之流程圖。 較佳實施例之詳細說明
後文說明中給定特定細節以供實施例之徹底瞭解。但熟諳技藝人士將瞭解實施例可無此等特定細節而予實施。舉例言之,系統可以方塊圖顯示來不致於以不必要的細節而遮掩實施例。眾所周知的方法、結構及技術可以不含不必要的細節而顯示以免遮掩實施例。
實施例提出一種方法及/或裝置用以在該計算裝置的作業系統出現無法復原的崩潰後,遠端管理一計算裝置得以繼續而無需實體介入。一般而言,在該計算裝置的作業系統出現無法復原的崩潰後,該計算裝置須進行實體復置。但實施例提出一種監督員系統來操作該作業系統使得當作業系統出現無法復原的崩潰時,無需實體復置該計算裝置,監督員系統即可回復該計算裝置之控制。因此透過該監督員系統遠端管理一計算裝置得以繼續而無需實體介入,於該處實體介入將包括派送人員至該計算裝置的實體位置來實體復置該計算裝置。
如此,實施例可減少或避免在該計算裝置的作業系統出現無法復原的崩潰時實體介入遠端管理計算裝置的機率。此外,實施例許可監督員系統攜帶崩潰後解決方案,諸如遠端通訊診斷資訊給管理器或遠端重新啟動該計算裝置。
第1圖為計算裝置100之一實例之方塊圖。計算裝置100之實施例例如可包括筆記型電腦、桌上型電腦、單板系統、平板計算裝置、可攜式讀取裝置、無線電子郵件裝置、行動電話等。於第1圖之實施例中,計算裝置100包括第一記憶體位置120、第二記憶體位置120、及處理器130。
第一及第二記憶體位置110及120可以是一或多個機器可讀取儲存媒體,諸如含有或儲存可執行指令之任何電子、磁性、光學、其它實體儲存裝置。如此第一及第二記憶體位置110及120例如可以是隨機存取記憶體(RAM)、可電氣抹除可規劃唯讀記憶體(EEPROM)、儲存裝置、光碟-唯讀記憶體(CD-ROM)等。
雖然於第1圖中第一及第二記憶體位置110及120係顯示為實體上分開的機器可讀取儲存媒體,但實施例可包括第一及第二記憶體位置110及120作為單一機器可讀取儲存媒體的一部分。舉例言之,第一及第二記憶體位置110及120可共享一共用位址結構,第一記憶體位置具有比該第二記憶體位置更低的記憶體位址。又,該單一機器可讀取儲存媒體諸如可實體上地或邏輯上地經區隔成為二或多個區劃,而該第一及第二記憶體位置110及120可以是占用該單一機器可讀取儲存媒體的不同區劃。
第一及第二記憶體位置110及120可儲存儲存可由該處理器130執行的一或多個應用程式或作業系統。於第1圖中,第一記憶體位置110係顯示為儲存監督員系統112來啟動與監視作業系統122,及第二記憶體位置120係顯示為儲存作業系統122來控制計算裝置100。
處理器130係基於該監督員系統112來開機該計算裝置100。開機一詞係指當啟動電源時計算裝置100所執行的操作之初始設定。舉例言之,當計算裝置100之電源啟動時,處理器130首先可執行儲存在監督員系統112的指令。另外,處理器130可首先執行基本輸出入系統(BIOS)或其類的指令,及然後指向監督員系統112的指令。
監督員系統112可以是介接在計算裝置100之硬體與作業系統122間的一型軟體包括程式及/或資料。監督員系統112的功能依據使用者或製造商的規格可有彈性且經決定。因此,雖然諸如透過監督員系統112的處理,監督員系統112可啟動與監視作業系統122,但監督員系統112也可設計用於額外功能,容後詳述。
監督員系統112係將計算裝置100之控制移轉給作業系統122,及當作業系統122內發生崩潰時,回復計算裝置100之控制。崩潰一詞可指稱當程式在作業系統122上跑時,或至少部分作業系統122未能適當操作時。例如,程式或作業系統122可能停止對輸入作回應,諸如於凍結或於暫停期間。概略言之,崩潰係由於被處理器130執行的指令造成發生錯誤的結果,諸如程式計數器被設定於不正確位址,或處理器130覆寫不正確的記憶體位址。
在有些型別的崩潰之後,作業系統122可能無法自動地恢復或復原適當功能。此等型別的崩潰通稱為無法恢復的崩潰,典型地要求計算裝置100的硬復置,於該處計算裝置100最初必須實體上關閉電源。舉例言之,硬復置初步可由使用者連續按下計算裝置100的電源鈕歷經臨界值時間長度諸如3秒或5秒進行。在計算裝置100的電源關閉後,計算裝置100可被再度電源啟動,或為遠端或藉再度按下電源鈕來完成計算裝置100的復置。
資料或軟體可能因硬復置而遺失或受損,原因在於作業系統122無法儲存或傳輸資料,或進行多種其它型別的操作,諸如適當關機程序。又復,硬復置無法遠端執行。因此個人諸如使用者或服務提供業者必須出現在患有無法回復的崩潰之計算裝置100的處所。
但於實施例中,當作業系統122無法從崩潰回復時,監督員系統112可回復計算裝置100之控制而無需復置計算裝置100的電力。舉例言之,於一個實施例中,監督員系統112在移交該計算裝置之控制給該作業系統122後係進入待命態。然後監督員系統112回應於硬體及軟體中斷中之至少一者而從待命態被喚醒。作業系統122可回應於未能執行一指令而產生軟體中斷,及計算裝置100或作業系統122則可回應於計時器諸如監視計時器的逾時而產生硬體中斷。此外,實施例並不限於前述中斷,監督員系統112可回應於技藝界已知用來偵測崩潰的其它中斷型別而被喚醒。
監督員系統112當控制計算裝置100時,將解除作動由該作業系統122對該計算裝置100之控制。舉例言之,監督員系統112可終止運轉作業系統122的處理來釋出先前由作業系統122所控制的該計算裝置100之系統資源的管理。監督員系統112的額外功能可包括存取計算裝置100之日誌,及執行先前在計算裝置100上的操作。舉例言之,監督員系統112可存取錯誤日誌或安全性日誌。錯誤日誌例如可回應於崩潰,指示例如計算裝置100的硬體組件或軟體指令。安全性日誌例如可指示使用者存取計算裝置100之一或多個硬體或軟體組件。
執行計算裝置100之操作例如可包括監督員系統112當控制計算裝置100時管理計算裝置100的電力設定。該等電力設定係包括一休眠、待命、節電、關機、及重新啟動態。又,當該監督員系統112管理該計算裝置之該等操作時可重新成像及重新格式化該第二記憶體位置。舉例言之,諸如當作業系統122已經訛誤或毀損超過修復狀態時,監督員系統112可重新安裝作業系統122在第二記憶體位置。
第2圖為包括第1圖計算裝置100之網路系統200一實例之方塊圖。於該第2圖之實施例中,網路系統200包括計算裝置100、網路元件210、及網路220。
網路元件210可包括能夠透過該網路220而與計算裝置100通訊的任一型裝置,諸如伺服器、數據機、網路卡等。網路元件210可包括或作為更大型基礎結構的一部分,諸如管理位址,由管理員或使用者用來遠端監控或管理該計算裝置100。
網路220可包括一或多個互連裝置,諸如網路介面卡、中繼器、中樞器、橋接器、開關、路由器、防火牆等。互連裝置可在網路元件210與計算裝置100間共享資源或資訊,諸如其間之通訊。
網路元件210係將透過網路220而監視與控制計算裝置100,當作業系統122內發生崩潰時,網路元件210係將與監督員系統112通訊。舉例言之,網路元件210可透過網路220存取該計算裝置之錯誤日誌或安全性日誌,在該計算裝置上執行診斷操作,或重新啟動該計算裝置。
又復,網路220可將計算裝置100的監督員系統112從待命態喚醒,於該處監督員系統112於移交該計算裝置100之控制給該作業系統122後即將進入待命態。
第3圖為該計算裝置之遠端崩潰復原方法之一實例之流程圖。雖然後文中係參考第1圖之計算裝置100描述方法300之執行,但用以執行方法300之其它適當組件將為熟諳技藝人士所顯然易知。
於第3圖之實施例中,於方塊310,計算裝置100被啟動電源。其次於方塊320,儲存在第一記憶體位置110的監督員系統112被載入,及計算裝置100之控制移交給監督員系統112。然後於方塊330,儲存在第二記憶體位置120的作業系統122被載入,及監督員系統112移交該計算裝置100之控制給該作業系統122。接著於方塊340,監督員系統112監控該作業系統122是否崩潰。於方塊340的監控可包括監督員系統112進入待命態,及回應於產生中斷而該監督員系統112從待命態中被喚醒。
於方塊350,若作業系統122崩潰,則監督員系統112從作業系統122回復計算裝置100之控制。監督員系統112可藉所產生的中斷而接到崩潰通知。如前文解說,中斷可以是例如回應於未能執行指令的軟體中斷,或回應於計時器逾時所產生的硬體中斷。
於方塊350,監督員系統112的回復控制可包括解除作動由該作業系統122對該計算裝置100之控制,及回復計算裝置100之控制而無需復置計算裝置100的電力。於回復控制後,如前文解說,監督員系統112可透過網路220而與網路元件210通訊。舉例言之,網路元件210可透過網路220存取該計算裝置100之錯誤日誌,在該計算裝置100上執行診斷操作,或重新啟動該計算裝置100。
依據前文說明,實施例提出一種方法及/或裝置用來在計算裝置的作業系統患有無法回復的崩潰後繼續計算裝置的遠端管理而無需實體介入。舉例言之,實施例提出一種監督員系統來運轉作業系統,使得當作業系統患有無法回復的崩潰時,監督員系統回復計算裝置之控制而無需實體上復置該計算裝置。因而可透過該監督員系統繼續計算裝置的遠端管理而無需實體介入。
100‧‧‧計算裝置
110、120‧‧‧記憶體位置
112‧‧‧監督員系統
122‧‧‧作業系統
130‧‧‧處理器
200‧‧‧網路系統
210‧‧‧網路元件
220‧‧‧網路
300‧‧‧方法
310-350‧‧‧處理方塊
第1圖為計算裝置之一實例之方塊圖;第2圖為包括第1圖計算裝置之網路系統一實例之方塊圖;及第3圖為該計算裝置之遠端崩潰復原方法之一實例之流程圖。
100‧‧‧計算裝置
110‧‧‧第一記憶體位置
112‧‧‧監督員系統
120‧‧‧第二記憶體位置
122‧‧‧作業系統(OS)
130‧‧‧處理器
权利要求:
Claims (15)
[1] 一種計算裝置,其係包含:儲存一監督員系統來啟動與監視一作業系統的一第一記憶體位置;儲存用來控制該計算裝置之該作業系統的一第二記憶體位置;及基於該作業系統來開機該計算裝置的一處理器,其中該監督員系統係將該計算裝置之控制移轉給該作業系統,及當該作業系統內發生崩潰時該監督員系統係將回復該計算裝置之控制。
[2] 如申請專利範圍第1項之計算裝置,其中當該作業系統無法從該崩潰中復原時,該監督員系統係將回復該計算裝置之控制而不需復置該計算裝置的電力。
[3] 如申請專利範圍第1項之計算裝置,其中,在將該計算裝置之控制移轉給該作業系統後,該監督員系統係將進入一待命態,及回應於一硬體及軟體中斷中之至少一者,該監督員系統係將從該待命態喚醒。
[4] 如申請專利範圍第3項之計算裝置,其中該作業系統係將回應於執行一指令之一失敗而產生該軟體中斷,及該計算裝置係將回應於一計時器之一逾時而產生該硬體中斷。
[5] 如申請專利範圍第1項之計算裝置,其中當該作業系統控制該計算裝置時,該監督員系統係解除作動由該作業系統對該計算裝置之控制。
[6] 如申請專利範圍第5項之計算裝置,其中該監督員系統係將執行存取該計算裝置之日誌及在該計算裝置上執行操作中之至少一者。
[7] 如申請專利範圍第5項之計算裝置,其中當該監督員系統係控制該計算裝置時,將管理該計算裝置之電力設定,該等電力設定係包括一休眠、待命、節電、關機、及重新啟動態中之至少一者。
[8] 如申請專利範圍第5項之計算裝置,其中當該監督員系統管理該計算裝置之該等操作時係將執行重新成像及重新格式化該第二記憶體位置中之至少一者。
[9] 如申請專利範圍第1項之計算裝置,其中當該作業系統內發生崩潰時,該監督員系統係將透過一網路而與一網路元件通訊,於該處該監督員系統係將透過該網路而從該網路元件接收指令用以監視及控制該計算裝置。
[10] 如申請專利範圍第9項之計算裝置,其中該監督員系統係將回應於透過該網路接收自該網路元件之要求而執行傳輸該計算裝置之錯誤日誌、在該計算裝置上執行診斷操作、及重新啟動該計算裝置中之至少一者。
[11] 如申請專利範圍第9項之計算裝置,其中該監督員系統係從該網路元件接收一喚醒指令而從一待命態喚醒,該監督員系統在將該計算裝置之控制移轉給該作業系統後係將進入該待命態。
[12] 一種用於一計算裝置之遠端崩潰復原之方法,該方法係包含:啟動該計算裝置之電源;載入及移交該計算裝置之控制給儲存在一第一記憶體的一監督員系統;藉該監督員系統載入及移交該計算裝置之控制給儲存在一第二記憶體的一作業系統;藉該監督員系統監視該作業系統之一崩潰;及當該作業系統內發生崩潰時,藉該監督員系統而從該作業系統回復該計算裝置之控制。
[13] 如申請專利範圍第12項之方法,其係進一步包含:在該回復控制後透過一網路而與一網路元件通訊,於該處該網路元件係將透過該網路而監視與控制該計算裝置,其中該通訊係包括透過該網路,該網路元件執行存取該計算裝置之錯誤日誌、在該計算裝置上執行診斷操作、及重新啟動該計算裝置中之至少一者。
[14] 如申請專利範圍第12項之方法裝置,其中,該回復控制係包括解除作動由該作業系統對該計算裝置之控制,及該回復係回復控制而不復置該計算裝置的電力。
[15] 一種儲存具有電腦可執行指令的一監督員系統之具體電腦可讀取媒體,該等電腦可執行指令當於該計算裝置之一處理器上執行時,使得該計算裝置執行下列各步驟包含:將該計算裝置之控制移轉給該作業系統;透過該監督員系統載入一作業系統,該監督員系統係移交該計算裝置之控制給該作業系統;透過該監督員系統監視該作業系統之一崩潰;及當該作業系統內發生崩潰時,透過該監督員系統而從該作業系統回復該計算裝置之控制。
类似技术:
公开号 | 公开日 | 专利标题
JP3777136B2|2006-05-24|コンピュータ装置、データのデッドコピー方法、プログラム、コンピュータ装置の稼動方法
JP6530774B2|2019-06-12|ハードウェア障害回復システム
US9846616B2|2017-12-19|Boot recovery system
US20180113764A1|2018-04-26|Hypervisor Based Watchdog Timer
US8661290B2|2014-02-25|Saving power in computing systems with redundant service processors
US20140068302A1|2014-03-06|Mechanism for facilitating faster suspend/resume operations in computing systems
US20110010706A1|2011-01-13|System and Method for Providing Redundancy for Management Controller
WO2018095107A1|2018-05-31|一种bios程序的异常处理方法及装置
US20070214349A1|2007-09-13|Driver/variable cache and batch reading system and method for fast resume
US20190004818A1|2019-01-03|Method of UEFI Shell for Supporting Power Saving Mode and Computer System thereof
US8914680B2|2014-12-16|Resolution of system hang due to filesystem corruption
AU2014376751B2|2017-07-27|Redundant system and method for managing redundant system
TWI461905B|2014-11-21|可遠端當機復原的運算裝置、用於運算裝置之遠端當機復原之方法及電腦可讀取媒體
CN101281416A|2008-10-08|确保系统关机完成的方法
JP5818257B2|2015-11-18|計算機システム、電源切断処理装置、電源切断処理方法およびプログラム
TWI493458B|2015-07-21|電腦裝置及其重開機方法
CN102023887A|2011-04-20|一种计算机系统的电源管理方法及计算机系统
CN104142832A|2014-11-12|电脑装置及其重开机方法
KR101100894B1|2012-01-02|임베디드 장치의 오류검출 및 복구방법
JP6424134B2|2018-11-14|計算機システム及び計算機システムの制御方法
US10104619B2|2018-10-16|Retrieval of a command from a management server
CN100401233C|2008-07-09|重新启动周边装置的方法
CN111356965A|2020-06-30|睡眠状态检测
WO2014112039A1|2014-07-24|情報処理装置、情報処理装置制御方法及び情報処理装置制御プログラム
JPH10268901A|1998-10-09|データ処理システム及びデータ処理装置
同族专利:
公开号 | 公开日
US9329920B2|2016-05-03|
EP2691853A4|2015-08-05|
US20140019796A1|2014-01-16|
CN103518188A|2014-01-15|
WO2012134420A1|2012-10-04|
CN103518188B|2017-05-24|
EP2691853B1|2021-02-24|
EP2691853A1|2014-02-05|
TWI461905B|2014-11-21|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
US5134580A|1990-03-22|1992-07-28|International Business Machines Corporation|Computer with capability to automatically initialize in a first operating system of choice and reinitialize in a second operating system without computer shutdown|
JP2001101033A|1999-09-27|2001-04-13|Hitachi Ltd|オペレーティングシステム及びアプリケーションプログラムの障害監視方法|
US6505298B1|1999-10-25|2003-01-07|International Business Machines Corporation|System using an OS inaccessible interrupt handler to reset the OS when a device driver failed to set a register bit indicating OS hang condition|
US6763456B1|2000-02-25|2004-07-13|Intel Corporation|Self correcting server with automatic error handling|
US6728896B1|2000-08-31|2004-04-27|Unisys Corporation|Failover method of a simulated operating system in a clustered computing environment|
US6769077B2|2000-12-20|2004-07-27|Microsoft Corporation|System and method for remotely creating a physical memory snapshot over a serial bus|
US6928579B2|2001-06-27|2005-08-09|Nokia Corporation|Crash recovery system|
US6782424B2|2002-08-23|2004-08-24|Finite State Machine Labs, Inc.|System, method and computer program product for monitoring and controlling network connections from a supervisory operating system|
JP4083531B2|2002-10-17|2008-04-30|株式会社エヌ・ティ・ティ・ドコモ|通信システム、転送装置、通信方法及びプログラム|
US6857011B2|2002-10-31|2005-02-15|Paragon Development Systems, Inc.|Method of remote imaging|
US20050050385A1|2003-08-26|2005-03-03|Chih-Wei Chen|Server crash recovery reboot auto activation method and system|
US7269768B2|2004-03-18|2007-09-11|Intel Corporation|Method and system to provide debugging of a computer system from firmware|
TWI235299B|2004-04-22|2005-07-01|Univ Nat Cheng Kung|Method for providing application cluster service with fault-detection and failure-recovery capabilities|
TWI267785B|2004-09-15|2006-12-01|Acer Inc|Installation method and the re-installation method of an operation system|
US7434102B2|2004-12-29|2008-10-07|Intel Corporation|High density compute center resilient booting|
US7325163B2|2005-01-04|2008-01-29|International Business Machines Corporation|Error monitoring of partitions in a computer system using supervisor partitions|
US8375386B2|2005-06-29|2013-02-12|Microsoft Corporation|Failure management for a virtualized computing environment|
US7702955B2|2005-12-28|2010-04-20|De Almeida Adrian S|Method and apparatus for detecting a fault condition and restoration thereafter using user context information|
KR100877239B1|2006-11-21|2009-01-08|주식회사 하우앳|시스템 원격복구방법|
US7941810B2|2006-12-28|2011-05-10|Intel Corporation|Extensible and flexible firmware architecture for reliability, availability, serviceability features|
JP2011060055A|2009-09-11|2011-03-24|Fujitsu Ltd|仮想計算機システム、仮想マシンの復旧処理方法及びそのプログラム|CN105183508B|2015-08-26|2019-02-15|北京元心科技有限公司|容器系统内应用程序的监控方法以及智能终端|
法律状态:
优先权:
申请号 | 申请日 | 专利标题
PCT/US2011/000577|WO2012134420A1|2011-03-31|2011-03-31|Supervisor system resuming control|
[返回顶部]